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摘要 : 本 研究 以 日 本 通 草 蛤 Chrysoperla nipponensis(Okamoto) 为 材料 ,采用 Oligo( dT) 引 物 定 问 克 隆 构建 cDNA 文库 3 
进行 EST 序 列 测定 , 旨 在 以 基因 库 的 形式 进行 种 质 资 源 的 保存 ,为 其 遗传 改良 奠定 基础 ,并 为 探讨 其 分 类 地 位 提供 
分 子 依据 。 对 该 文库 质量 分 析 表 明 : 库 容量 为 1.0 x 10, 重组 率 为 80.0% ,平均 插入 片段 为 512 bp。 测 序 后 最 终 成 
功 得 到 323 条 表达 序列 标签 (expressed sequence tags, ESTs ) 序 列 , 经 Phrap 程序 聚 类 拼接 后 得 到 236 条 单 基因 艇 
Cunigene), 包 括 86 个 重 营 群 (congtigs) 和 150 个 单 拷贝 (singlets)。 使 用 NCBI 中 的 BlastN 和 BlastX 程序 对 236 条 ESTs 
进行 本 地 化 搜索 ，BlastN 的 结果 表明 : 180 条 ESTs(76.3% ) 没 有 注解 ，56 条 EST8(23.7% ) 与 GenBank 上 公布 的 序列 
较 高 的 同 源 性 , 其 中 一 条 序列 被 确定 为 该 种 的 16S rRNA 基因 ,利用 MEGA 软件 构建 了 基于 该 16S rRNA 序列 草 蛤 
科 的 系统 发 育 树 ,结果 显示 通 草 岭 属 Chrysoperla 与 义 草 岭 属 Dichochrysa、 玛 草 蛤 属 Mallada、 草 岭 属 Chrysopa 的 亲缘 
关系 比较 近 , 这 与 传统 分 类 相 吻 合 。BlastX 的 比 对 结果 为 197 条 ESTs(83.5% ) 有 功能 注解 ，39 条 ESTs(16.5% ) 无 注 
解 或 score 值 小 于 100。 使 用 GO( gene ontology) 数 据 库 对 236 条 ESTs 序列 进行 功能 注释 , 结果 表明 : 142 条 ESTs 
(59.7% ) 有 注解 ,并 表达 出 40 多 种 基因 产物 。 
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中 图 分 类 号 : 0966 ”文献 标识 码 : A ”文章 编号 : 0454-6296(2008 )08-0792-06 


cDNA library construction and analysis of some ESTs of Chrysoperla 





































































































































































































































































































































































































nipponensis (Okamoto) (Neuroptera: Chrysopidae) 

NIE Rui-E’, YANG Xing-Ke’, LIU Zhi-Qi”“ (1. Department of Entomology, China Agriculture University， 
Beijing 100193, China; 2. Institute of Zoology, Chinese Academy of Sciences, Beijing 100101, China) 
Abstract Based on the construction technology of non-normalized cDNA library, the cDNA library of 
Chrysoperla nipponensis (Okamoto) was constructed, which aimed to preserve the resources in the form of 
cDNA library, to help to modify its genes and to provide the molecular basis for the classification of 
Chrysoperla nipponensis . The library capacity was 1.0 x 10°, the average size of insert cDNA was 512 bp, and 
the recombination frequency was 80.0%. In total 323 expressed sequence tags (ESTs) were generated 
successfully after sequencing, and 236 nonrepetitive sequences including 86 contigs and 150 singlets were 
obtained using cluster analysis with Phrap software. The 236 ESTs were analyzed with BlastN and BlastX of 
NCBI. The BlastN analysis showed that 180 (76.3% ) from the 236 ESTs could not be compared, and the 
other 56 (23.7% ) had a high homology with the available sequences from GenBank, of which one sequence 
was considered to be 16S TRNA gene. Based on the 16S rRNA sequences, phylogenetic tree was constructed 
by MEGA, and the result showed that the evolutionary relationship of Chrysoperla, Dichochrysa, Mallada and 
Chrysopa was relatively close, which coincides with the traditional classification. The BlastX analysis showed 
that among the 236 ESTs, 179 (83.5% ) could be functionally annotated, and the other 39 (16.5%) had no 
functional information or a score less than 100. Finally, 236 ESTs were annotated by GO (gene ontology) 
database, and the results showed that 142 ESTs (59.7% ) could be functionally annotated and expressed 40 


products. 
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日 本 通 草 蛤 Chrysoperla nipponensis (Okamoto ) 忆 
于 脉 翅 目 (Neuroptera), 草 蛤 科 (Chrysopidae), 草 蛤 3 
科 (Chrysopinae), 通 草 蛤 属 Chrysoperla, 其 异 名 包 所 
中 华 草 蛤 Chrysopa sinica〈Tjeder，1936)、 中 华 通 草 1 
Chrysoperla sinica 。 日 本 通 草 蛤 为 东洋 、 古 北 区 系 种 ， 
在 我 国 广泛 分 布 ,捕食 能 力 强 ,是 农林 、 果 区 害虫 的 
重要 捕食 性 天 敌 之 一 ,也 是 天 敌 的 优势 种 群 , 故 在 生 
物 防 治 中 起 到 了 重要 的 作用 ( 杨 星 科 和 杨 集 昆 ， 
1992; 杨 星 科 等 ，2005)。 
自 20 世纪 70 年代 首 例 cDNA 克隆 问世 以 来 , 构 
建文 库 已 成 为 研究 功能 基因 组 学 的 基本 手段 之 一 。 
cDNA 没有 内 含 子 结构 ,便于 克隆 和 表达 , 因此 可 以 
从 文库 中 筛选 到 所 需 的 目的 基因 , 并 直接 用 于 该 目 
的 基因 表达 ( 任 邦 哲 ，1993)。 目 前 , cDNA 文库 已 被 
| 泛 用 于 濒危 珍稀 生物 资源 的 保存 、 分 子 标记 连锁 
谱 所 用 探 针 的 构建 ,全 长 基因 的 分 离 及 功能 研究 
等 。 另 外 ,通过 大 规模 随机 选取 cDNA 克隆 进行 表 
达 序 列 标签 (expressed sequence tag，EST) 测 序 分 析 ， 
将 直接 发 现在 某 个 重要 生理 过 程 或 发 育 阶段 的 新 基 
因 或 侯 选 基因 ,获得 基因 组 中 与 生物 学 、 医 学 和 生物 
防治 等 关系 最 密切 的 信息 ,以 此 了 解 其 基因 表达 谱 
(Adams et al.，1991; 李 春 峰 等 ，2008 )。 

过 去 对 草 蛤 科 (Charysopidae) 的 研究 主要 集中 在 
传统 分 类 、 生 物 防治 和 生理 毒 理 等 方面 ,而 对 其 分 子 
生物 学 和 重要 基因 分 离 克 隆 等 研究 得 比较 少 。 最 早 
有 关 脉 这 目的 分 子 生物 学 研究 是 Henry 等 (1999 ) 利 
用 线粒体 DNA 中 的 COI 和 ND2 基因 探讨 了 草 蛤 科 
通 草 蛤 属 18 个 种 的 系统 发 育 ，Haring 和 Aspick 
《2004) 利 用 COX3，18S rRNA，16S rRNA, EF-lo 基因 
序列 研究 脉 怒 目的 15 个 科 之 间 的 系统 进化 关系 。 
Winterton(2006) 利 用 CAD，CO 工 ，16S rRNA 基因 序 
列 对 草 蛤 科 18 属 33 种 的 系统 发 育 关系 进 行 分 析 。 
Lourenc 等 (2006) 利 用 Cytb，CO ,CO 了，16S TRNA 
基因 片段 对 欧洲 地 区 通 草 蛤 属 C. camea group 的 7 
个 种 进行 了 分 子 分 类 的 研究 。 截 止 到 2008 年 4 月 ， 
GenBank 上 共 公 布 了 通 草 蛤 属 312 条 核 节 酸 序列 , 涉 
及 到 17 个 已 知 种 和 10 多 个 未 知 种 ,但 没有 ESTs 序 
列 的 记录 ,并 且 312 条 序列 中 没有 日 本 通 草 蛤 的 基 
因 序列 。 本 研究 以 日 本 通 草 蛤 为 材料 , 构建 cDNA 
文库 并 进行 ESTs 序列 的 测定 与 分 析 , 旨 在 以 基因 库 
的 形式 进行 种 质 资源 的 保存 , 为 草 蛤 的 遗传 改良 黄 
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定 基 础 。 男 外 ,我 们 也 期 望 能 在 所 测 的 序列 中 找到 
与 系统 发 育 相 关 的 序列 , 为 明确 其 分 类 地 位 提供 分 
子 方面 的 依据 。 


1 材料 与 方法 


1.1 实验 材料 

2007 年 4 月 中 旬 , 从 北京 植物 园 采集 活体 成 
虫 ,经 外 部 特征 和 解剖 部 分 成 虫 的 生殖 器 鉴定 为 日 
本 通 草 蛤 C. nipponensis。 供 试 材料 均 为 活体 ,经 液 
所 速冻 后 保存 于 - 80% 超 低温 冰箱 备用 。 
1.2 总 RNA 的 提取 及 mRNA 的 分 离 

按 QIAGEN 公司 的 RNeasy Midi Kit 操作 手册 提 
取 日 本 通 草 蛤 虫 体 总 RNA, 经 琼脂 糖 凝 胶 电泳 检测 
其 质量 。 然 后, 采用 Oligotex mRNA Midi Kit 
(QIAGEN) 分 离 mRNA, 并 用 分 光 光 度 计 检测 其 纯 
度 。 
1.3 双 链 cDNA 合成 
1.3.1 cDNA 第 一 链 的 合成 : 以 分 离 纯化 的 日 本 通 
草 蛤 的 mRNA 为 模板 ,用 带 有 Xho 工 酶 切 位 点 的 
Oligo( dT)is 为 引物 , 在 SuperSciptTM [ RNaseH- 
Reverse Transcriptase 作用 下 转录 出 cDNA 第 一 链 。 
主要 步骤 为 :首先 向 RNase-free 的 0.5 mL eppendorf 
这 里 ,加 入 9 pL mRNA 1 ywL Xho | Primer(1.4 
Lg/vL; 奥 科 合 成 ), 2 nL RNase-free water; 混 匀 后 ， 
70C 反 应 10 min; 反应 完成 后 , 混 匀 后 立刻 将 反应 
体系 放 在 冰 上 ; 依次 加 入 4 LL 5 x first strand buffer, 
2 uL0.1 mol/L DTT，1 pL 10 mmol/L dNTP; 稍微 离心 
混 匀 后 ，42% 放置 2 min; 加 入 1 pL Superscipt-RT; 
离心 混 匀 ,42% 反 应 50 min; 最 后 , 70% 灭 活 反 转录 
酶 15 min。 
1.3.2 cDNA 第 二 链 的 合成 :第 一 链 反 应 完成 后 , 在 
反应 体系 中 按 顺 序 加 入 :20 nL 10 x DNA Polymerase 
T buffer, 6 pyL 10 mmol/L dNTP, 103 nL ddH,0, 1 pL 
RNase H (2 U/L), 10 pyL DNA Polymerase | (10 
U/uL); 混 匀 后 16% 反 应 2.5 h; 70% 灭 活 10 min。 
1.3.3 双 链 cDNA 末端 补 平 及 EoR 工 接头 的 加 接 : 
在 T4 DNA polymerase 的 作用 下 将 双 链 cDNA 的 末端 
补 平 ,经 过 酚 / 氯 仿 / 异 戊 醇 纯 化 去 除 多 余 的 蛋白 等 
杂质 后 ,在 T4 DNA Ligase 的 作用 下 连接 EcoR I 
Adaptor 过 夜 。 
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1.3.4 双 链 cDNA 末端 的 磷酸 化 和 Xho 工 酶 切 : 加 
好 接头 的 cDNA 双 链 先 在 T4 多 聚 核 音 酸 激酶 (中 
PNK) 的 作用 下 进行 末端 磷酸 化 ,然后 经 内 切 酶 Xho 
I 工 酶 切 消化 ,琼脂 糖 凝 胶 电泳 后 采用 QIAEXII Gel 
Extraction Kit 回收 >0.5 kb 的 cDNA 片段 。 

1.3.5 连接 和 转化 : 将 目的 片段 和 载体 pBluescript 
I SKC + )XR 按照 3:1 的 比例 在 T4 DNA Ligase 的 作 
用 下 连接 过 夜 。 连 接 体系 10 ulL, 所 有 的 连接 产物 在 
做 转化 前 通过 Millipore 的 膜 纯化 去 除 盐 离子 得 到 10 
二 连接 产物 。 最 后 , 取 2 pL 连接 产物 采用 电 转 化 
法 将 其 转化 到 感受 态 细胞 DH10B 内 ,37C 过 夜 培养 
后 观察 生长 情况 。 

1.4 cDNA 克隆 的 EST 测序 和 质量 控制 

EST 测序 主要 包括 模板 制备 ,测序 反应 、 序 列 识 

别 等 流程 。 模 板 制备 采用 半自动 化 流水 线 方 式 , 主 
要 步骤 包括 文库 铺 板 培养 .大 量 随 机 挑 取 菌 落 
cDNA 克隆 )、 细 菌 增殖 、 质 粒 DNA 提取 、 电 泳 鉴定 
等 。 本 研究 以 T3(5'-ATTAACCCTCACTAAAG-3') 为 
引物 从 5' 端 进行 测序 ,测序 工作 在 北京 华 大 基因 研 
究 中 心 完成 ; 获得 的 ESTs 数据 使 用 Crossmatch 程序 
去 除 载 体 、 宿 主 菌 、 线 粒 体 或 重复 序列 的 污染 ,然后 
对 高 质量 序列 用 Phrap 程序 进行 聚 类 拼接 , 参数 为 
程序 默认 值 , 拼接 后 得 到 的 一 致 序列 包括 : ESTs 的 
重 登 群 (congtigs) 和 单 拷贝 (singlets )。 
1.5 ESTs 数据 分 析 
1.5.1 使 用 NCBI 中 的 BlastN 和 BlastX 程序 对 聚 类 
后 的 ESTs 进行 核酸 和 和 蛋白 库 的 本 地 化 搜索 , 获得 注 
释 信 息 , BlastN 比 对 时 采用 默认 参数 , BlastX 比 对 时 
参数 设 定 为 期 望 值 小 于 1 e-" 或 score 值 大 于 100; 
数据 库 版 本 为 2008 年 4 月 13 日 。 

1.5.2 利用 GO( gene ontology) 中 的 AmiGO 数据 库 
对 聚 类 后 的 ESTs 进行 GO 注释 , 该 软件 对 所 输入 的 
ESTs 依据 序列 的 类 型 在 BlastP 或 BlastX 数据 库 中 进 
行 本 地 化 的 搜索 ,将 期 望 阔 值 设 为 1 e ,搜索 后 有 
功能 的 ESTs 将 得 到 批量 的 GO 注释 ,注释 信息 分 为 
分 子 功能 、 生 物 过 程 和 细胞 组 分 3 个 水 平 。AmiGO 
数据 库 版 本 为 2008 年 4 月 13 日。 

1.5.3 经 BlastN 搜索 后 , 有 注解 的 ESTs 序列 中 有 
一 条 序列 与 草 蛤 科 的 7 个 种 的 16S rRNA 基因 最 大 
一 致 性 均 在 95% 以 上 , 将 该 序列 确定 为 该 物种 的 
16S rRNA 基因 。 为 了 探究 日 本 通 草 蛤 的 分 类 地 位 ， 
本 研究 以 约 草 蛤 亚 科 (Nothchrysinae ) 的 Nothochrysa 
californica( Bank，1892) 及 褐 蛤 科 (Hemerobiidae ) 褐 蛤 
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届 Hemerobius 的 Hemerobius fenestratus (Tjeder, 1932) 
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为 外 群 , 利用 Mega3.1 软件 构建 了 基于 该 序列 草 蛤 
科 5 属 7 种 ( 除 日 本 通 草 蛤 序列 外 其 他 序列 均 载 自 
GenBank) 的 系统 发 育 树 (图 4)。 自 展 检 验 (bootstrap 
test) 评 估 所 建 系统 树 的 可 靠 性 , 重复 1 000 次 评估 各 
分 支 的 置信 值 。 


2 结果 与 分 析 



























































2.1 日 本 通 草 蛤 总 RNA 及 mRNA 的 分 离 

将 制备 好 的 总 RNA 取 0.5 pL 电泳 检测 ,可 以 清 
晰 看 见 28S RNA，18S RNA，5S RNA 3 条 条 带 ( 图 
1), 说 明 总 RNA 质量 较 好 基本 没有 降解 ,完整 性 较 
































好 。 分 离 纯化 的 mRNA 利用 分 光 光 度 计 检测 得 








OD;owso = 1.89, 表 明 mRNA 纯度 较 高 ,符合 建 库 引 
2.2 cDNA 文库 的 构建 

2.2.1 双 链 cDNA 的 合成 : 将 双 链 cDNA 的 产物 取 
3 上 岂 电泳 检测 (图 2) 后 呈现 从 小 到 大 均匀 分 布 的 拖 
带 , 大 小 在 0.1~ 0.5 kb 的 范围 内 ,主要 集中 在 300 
bp 以 上 ,表明 日 本 通 草 蛤 的 mRNA 成 分 多 样 性 ; 在 
紫外 灯 下 用 QIAEXII Gel Extraction Kit 回收 > 0.5 kb 
的 目的 片断 。 
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Fig. 1 Agarose gel electrophoresis of total RNA 

2.2.2 cDNA 质量 鉴定 : 将 目的 片段 和 载体 

pBluescript 全 SK(C + )XR 在 T4 DNA Ligase 的 作用 下 

连接 过 夜 , 连接 产物 经 电泳 检测 后 采用 电 转化 法 转 

化 到 感受 态 细胞 DH10B, 37% 过 夜 培养 后 长 出 430 
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图 1 总 RNA 琼脂 糖 凝 胶 电 } 
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图 2 双 链 cDNA 琼脂 糖 凝 胶 电 泳 
Fig.2 cDNA agarose gel electrophoresis 
1: DL-2000 Marker; 2: 双 链 cDNA Double stranded cDNA. 


菌落 , 蓝 白 斑 比 例 为 86:344, 重组 率 为 80.0%， 
该 文库 的 库容 量 为 1.0 x 10 个 克隆 ,说 明 已 经 达到 
了 文库 的 质量 要 求 。 随 机 挑选 16 个 噬 菌 斑 经 PCR 
扩 增 , 电泳 结果 显示 文库 插入 的 片段 的 平均 长 度 大 
于 500 bp，16 个 吻 菌 斑 仅 有 一 个 没有 插入 (图 3)。 
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图 3 日 本 通 草 蛤 cDNA 文库 插入 片段 的 PCR 鉴定 











Fig.3 PCR analysis of recombinant clones from the cDNA 
library of Chrysoperla nipponensis 
M: DL-2000 Marker; 1- 16: 扩 增 产物 Amplification products. 


2.3 EST 序列 测定 与 拼接 

本 实验 共 测 了 400 个 克隆 , 经 Cross-match 程序 
去 除 低 质量 的 序列 后 最 终 得 到 323 条 有 效 ESTs 序 
列 ,其 平均 长 度 为 512 bp。 使 用 Phrap 默认 参数 拼接 
后 得 到 86 个 重 车 群 和 150 个 单 拷贝 , 共计 236 条 单 
基因 徐 (unigene), 在 GenBank 上 的 登录 号 为 ; 
FE426453 - FE426472 和 FE527661 - FE527876。 
2.4 序列 分 析 
2.4.1 EST 的 BlastN 和 BlastX 注解 结果 : 将 聚 类 拼 

















接 后 的 236 条 ESTs 序列 使 用 NCBI 中 的 BlastN 和 
BlastX 程序 进行 本 地 化 搜索 后 , BlastN 的 结果 表明 : 
180 条 序列 (76.3% ) 没 有 注解 ,56 条 序列 (23.7% ) 与 
GenBank 上 公布 的 序列 有 较 高 的 同 源 性 ,有 注解 的 
序列 大 部 分 都 与 昆虫 的 基因 序列 有 很 高 的 同 源 性 ; 
无 注解 的 序列 所 占 的 比例 较 大 , 这 些 序列 可 能 是 该 
物种 新 的 ESTs 序列 。 另 外 ,有 4 条 与 真 苗 的 同 源 性 
较 高 , 可 能 是 由 于 虫 体 本 身 的 寄生 物 所 引起 的 。 
BlastX 的 比 对 结果 : 39 条 ESTs(16.5% ) 无 注解 或 
score 值 小 于 100 的 序列 ; 197 条 EST8(83.5% ) 有 功 
能 注解 的 序列 , 与 BlastN 的 对 比 结果 相 比 有 注解 的 
序列 明显 增多 。 

2.4.2 G0 注解 : 使 用 AmiG0 数据 库 进 行 GO 注释 
发 现 236 条 ESTs 中 有 142 条 可 归属 于 分 子 功能 、 生 
物 过 程 和 细胞 组 分 三 大 类 , 占 ESTs 总 数 的 59.7%， 
GO 分 类 结果 见 表 1。 这 142 条 ESTs 共 表 达 出 40 多 
种 基因 产物 ,其 中 核糖 体 蛋 白细胞 色素 氧化 酶 、 细 
胞 色素 复合 体 、 儿 丁 质 酶 .射精 管 球 蛋 白 、 触 角 和 蛋白 
等 表达 程度 比较 高 。 

2.4.3 系统 发 育 树 : 从 该 系统 树 的 拓扑 结构 可 以 
看 出 : 日 本 通 草 蛤 C，nipponensis 与 通 草 蛤 属 的 普 
通 草 蛤 C. comeaw、 通 草 蛤 C. externa 聚 在 一 起 ,同时 
还 可 以 看 出 通 草 蛤 属 与 又 草 蛤 属 Dichochrysa、 玛 草 
蛤 属 Mallada 的 关系 较 近 , 成 为 姊妹 群 , 与 草 蛤 属 
Chrysopa 的 亲缘 关系 次 之 , 与 意 草 蛤 属 Jtalochrysa 的 
亲缘 关系 最 远 ,这 与 目前 的 形态 分 类 学 的 观点 相 吻 
合 。 但 要 全 面 探 讨 通 草 蛤 属 的 分 类 地 位 , 还 应 进 一 
步 采 用 其 他 分 子 标记 (如 细胞 色素 氧化 酶 和 


等 )。 



























































































































































3 讨论 


3.1 cDNA 文库 的 构建 及 ESTs 序列 

每 个 EST 代表 一 个 表达 基因 的 部 分 转录 片段 ， 
被 广泛 应 用 于 大 规模 基因 鉴定 (Bogusk，1994)、 图 
谱 构 建 (Boguski and Schuler，1995)、 基 因 预 测 ( Bailey 
et al .，1998; 印 咏 梅 等 2004)、 多 态 性 分 析 ( Buetow 
et al .，1999; Garg et al.，1999) 和 表达 差异 ( Okubo 
et al .，1992) 等 研究 ,为 寻找 新 基因 和 了 解 基因 的 表 
达 概 况 提 供 了 一 条 快速 、 便 捷 的 途径 。 近 年 来 , EST 
也 被 用 于 开发 物种 的 微 卫星 DNA 分 子 标记 SSR 
(simple sequence repeats), 即 EST-SSR, 它 在 遗传 图 谱 
的 构建 遗传 多 样 性 分 析 、 杀 缘 关 系 鉴定 、 指 纹 图 谱 
构建 、 功 能 基因 标记 和 比较 作 图 等 方面 具有 公认 的 

























































































































































































































































































































796 昆虫 学 报 hcta Entomologica Sinica 51 卷 
表 1 日 本 通 草 输 ESTs 的 GO 基因 产物 预测 结果 
Table 1 The forecast result of GO gene products of Chrysoperla nipponensis ESTs 
基因 产物 Gene product 0 基因 产物 Gene product 0 
蛋白 激酶 Protein kinase 1 细胞 色素 C 氧化 酶 Cytochrome c oxidase 4 
化 学 感应 蛋白 Chemoreceptive protein 1 致死 因子 Lethal factor 1 
核糖 体 蛋 白 Ribosomal protein 38 核 昔 二 磷酸 激酶 Nucleoside diphosphate kinase 1 
肌 动 蛋白 Actin 2 表皮 和 蛋白 Cuticular protein 2 
甘油 脂 脂 肪 酶 Triacylglycerol lipase 1 细胞 色素 Cytochrome 3 
儿 丁 质 酶 Chitinase 和 琥珀 酸 合成 酶 Arginosuccinate synthetase 1 
触角 蛋白 Antennal protein 1 snRNA 关联 蛋白 snRNA-associated protein 1 
肌肉 蛋白 Muscle protein 2 线粒体 核糖 体 和 蛋白 Mitochondrial ribosomal protein 2 
磷酸 脱氧 酶 Phosphate dehydrogenase 1 转运 蛋白 Transport protein 2 
线粒体 乙醇 脱氧 酶 Mitochondrial alcohol dehydrogenase 1 结合 蛋白 Binding protein 2 
微 管 蛋 白 Tubulin 1 热 激 蛋白 Heat-stress protein 1 
人 硫 氧 还 蛋白 还 原 酶 Thioredoxin reductase 信号 肽 蛋白 酶 Signal peptide protease 1 
鸟 氨 酸 脱羧 酶 Omithine decarboxylase 1 肽 基 异 构 酶 Peptidyl isomerase 1 
延伸 因子 Flongation factor 1 l 球 蛋白 Myosin 1 
成 虫 盘 生 长 因子 Dise growth factor 1 烯 醇 酶 Enolase 1 
细胞 色素 Cytochrome c 3 其 他 匹配 基因 Other matching genes 20 
射精 管 球 和 蛋白 Bulb protein 1 未 知 功 能 或 新 ESTs Unknown or new ESTs 96 
间 肪 酶 Lipase 1 
Chrysoperla nipponensis 
Chrysoperla externa 
Chrysoperla carnea 
Dichochrysa tacta 
Mallada alpofucialis 
Chrysopa perla 
Halochrysa insignis 
Nothochrysa californica 
Hemerobius fenestratus 
mg 1 
图 4 基于 16s rRNA 基因 建 的 NJ 树 ( 自 展 值 为 1 000 次 重复 ) 
Fig. 4 NJ tree based on 16s rRNA (1 000 replicates of bootstrap values) 
外 群 Outgroup: Nothochrysa californica,， Hemerobius fenestratus . 
优越 性 和 广阔 的 应 用 前 景 。 因 此 ,对 于 一 个 分 子 生 ”EST 序 列 测定 , 由 于 经 费 所 限 我 们 只 测 了 323 条 有 











物 学 研究 刚刚 起 步 的 物种 来 说 , 研究 EST 序列 具有 

ESTs 的 长 度 直 接 决 定 了 所 测 cDNA 和 mRNA 的 
信息 含量 ,长 度 在 150 bp 以 上 的 ESTs 序列 所 含 的 信 
息 量 最 高 , 而且 非常 适合 与 同 源 产 物 的 寻找 和 图 
的 构建 ( 陈 佳 韵 等 ,1999)。 但 100 bp 以 上 的 ESTs 序 
列 就 可 以 有 完整 的 Poly A 结构 和 Mbo 工 酶 切 位 点 ， 
有 足够 的 信息 量 , 世界 上 访问 量 最 高 的 GenBank 数 
据 库 接收 ESTs 序列 的 最 低 要 求 也 为 100 bp, 因此 ， 
长 度 大 于 100 bp 的 EST 序列 可 视 为 有 效 序 列 。 本 
研究 以 日 本 通 草 蛤 为 材料 构建 其 cDNA 文库 并 进行 






































3.2 ESTs 序列 的 功能 注解 
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具 , 但 它 也 有 自 
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Blast 相似 搜索 的 优点 有 效 的 提高 了 自 
确 性 , 由 于 GO 现在 还 在 发 展 中 , 有 些 序列 可 能 预 涡 








效 的 EST 序列 ,平均 长 度 为 512 bp, 大 于 150 bp 的 序 
列 有 317 条 , 说 明 ESTs 的 质量 较 高 , 可 以 用 来 构建 
EST 图 谱 , 寻找 同 源 产 物 研究 其 功能 。 


Blast( Basic Local Alignment Search Tool) 是 目前 常 
用 的 数据 库 搜索 程序 , 是 注解 新 基因 功能 的 基础 工 
E 以 元 服 的 缺点 ,不 适合 专门 用 来 
作 基 因 功 能 注解 (Altschul et al.，1997)。 而 基于 GO 
发 展 的 基因 注解 工具 充分 利用 了 比较 基因 组 方法 





动 注解 的 诊 
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8 期 基 瑞 娥 等 : 日 本 通 草 蛤 cDNA 文库 构建 及 部 分 ESTs 分 析 797 








不 到 结果 (Ashbumer et al.，2000), 所 以 本 文 将 Blast 
和 GO 结合 起 来 对 序列 进行 分 析 , 使 预测 更 具 目 的 
性 和 准确 性 。 
本 研究 的 BlastN 比 对 结果 表明 : 所 测 的 ESTs 
序列 中 有 23.7% 的 序列 有 注释 ，76.3% 没 有 注解 。 
这 说 明 新 的 ESTs 序列 占 的 比例 比较 大 , 这 是 由 于 到 
目前 为 止 在 GenBank 上 还 没有 通 草 蛤 属 的 ESTs 被 
提交 ， 同 时 也 说 明 对 日 本 通 草 蛤 的 功能 基因 组 研究 
用 有 待 于 进一步 加 强 。 经 BlastX 数据 库 搜索 后 有 注 
解 的 序列 为 83.5% ,与 BlastN 的 对 比 结果 相 比 有 注 
解 的 序列 明显 增多 , 这 是 由 于 核 蔡 酸 序 列 按 6 条 链 
翻译 成 蛋白 的 原因 , 也 说 明 所 测 的 大 部 分 ESTs 序列 
都 能 翻译 成 蛋白 。 

对 所 测 得 ESTs 序列 利用 GO 进行 了 生物 信息 
学 分 析 , 结果 有 59.3% 的 序列 在 分 子 功能 、 生 物 过 
程 和 细胞 组 分 三 方面 有 注释 , 这 些 信息 大 部 分 出 自 
果 晶 数据 库 。 从 有 注解 的 序列 的 翻译 产物 可 以 看 出 
该 文库 所 测 得 ESTs 在 翻译 水 平 上 的 基因 产物 很 丰 
富 ,142 条 ESTs 共 表 达 出 40 多 种 基因 产物 ,我 们 将 
进一步 测序 以 了 解 日 本 通 草 蛤 更 多 的 基因 信息 ,为 
日 本 通 草 蛤 乃至 通 草 蛤 属 的 功能 基因 组 及 ESTs 序 
列 的 研究 莫 定 基础 。 
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